卷积层的批标准化¶
Note
之前我们讲过全连接层的批标准化(Batch Normalization,BN),卷积层的批标准化也是类似的
形式化¶
回想全连接层的批标准化:
BN(x)=γ⊙x−ˆμBˆσB+β
ˆμB=1|B|∑x∈Bx
ˆσ2B=1|B|∑x∈B(x−ˆμB)2+ϵ
卷积层批标准化也是这个公式,γ,β 是可训练参数。
Warning
区别在于卷积层的是每个输入通道一个标量均值和方差,不像全连接层的是每个特征一个标量均值和方差。
这样有多少个通道就有多少个均值、方差对;标准化后可以保证各个通道总体在一个量纲。
卷积层的批标准化也是在卷积之后,激活函数之前。